Améliorer les performances d'un modèle prédictif: perspectives et réalité

نویسنده

  • Stéphane Tuffery
چکیده

Résumé. Dans cet article, nous montrons que les performances d’un modèle prédictif dépendent généralement plus de la qualité des données et du soin apporté à leur préparation et à leur sélection, que de la technique de modélisation elle-même. Entre deux techniques, l’écart de performance est souvent négligeable en regard des incertitudes résultant de la définition de la variable à expliquer et de la représentativité de l’échantillon d’étude. Toutefois, le rééchantillonnage et l’agrégation de modèles peuvent permettre de réduire drastiquement la variance et parfois même le biais de certains modèles. De bons résultats peuvent aussi être obtenus simplement par la partition de modèles, c’est-à-dire en partitionnant en classes l’échantillon initial et en construisant un modèle sur chaque classe.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Conception d'un Simulateur de Grilles Orienté Gestion d'équilibrage

Résumé. Les dernières évolutions dans le calcul distribué ont conduit à l’apparition de nouvelles infrastructures appelées grilles de calcul. La gestion d'équilibrage de charge dans ce type d'infrastructure est complexe et exige donc des outils sophistiqués pour analyser les algorithmes avant de les appliquer aux vrais systèmes. Cependant une recherche étendue a été conduite dans le domaine de ...

متن کامل

Réalité mixte et travail collaboratif : IRVO, un modèle de l'interaction homme-machine. (Mixed reality and collaborative work: IRVO, a human-computer interaction model)

ion de l’application Présentation de l’application Figure 42 : Les couches de l’implémentation de AMF Ce rapprochement d’AMF avec Arch permet d’aller au-delà d’un simple modèle d’architecture. En effet, le modèle AMF est directement instancié en contrôleur de dialogue et le « moteur AMF » pilote donc le dialogue de l’application [Vaisman 2002]. Le formalisme graphique utilisé pour modéliser la ...

متن کامل

Améliorer les performances de l'industrie logicielle par une meilleure compréhension des besoins

progrès considérables réalisés par la technologie informatique, on constate que les acteurs restent très souvent critiques par rapport à leur systèmes d'information. Une des causes de cet écart entre les espoirs et la réalité trouve sa source dans la difficulté à produire un cahier des charges suffisamment détaillé pour les opérationnels et interprétable par les spécialistes des systèmes d'info...

متن کامل

Étude Comparative d'un Détecteur CFAR Neuronal de Plusieurs Cibles Radar dans un Fouillis de type K-Distribution

This paper presents the development and performance evaluation of a particular Multi-Layer Perceptron neural network (MLP) classifier for radar target detection in a noisy, non-Gaussian environment using CFAR (Constant False Alarm Rate). The Technique, architecture details and principle of working of the MLP-CFAR detector training algorithm are presented. A comparison of the MLP-CFAR performanc...

متن کامل

Le forage distribué des données: une méthode simple, rapide et efficace

Résumé. Dans cet article nous nous attaquons au problème du forage de très grandes bases de données distribuées. Le résultat visé est un modèle qui soit et prédictif et descriptif, appelé méta-classificateur. Pour ce faire, nous proposons de miner à distance chaque base de données indépendamment. Puis, il s’agit de regrouper les modèles produits (appelés classificateurs de base), sachant que ch...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005